サウンドレコーダーで保存したM4Aファイルを無理やりAmazon Transcribeで文字起こし #AWSreInvent

AWS re:Invent 2023

#Python

#Amazon Transcribe

#AWS

えがわ

2023.11.30

この記事は公開されてから1年以上経過しています。情報が古い可能性がありますので、ご注意ください。

ゲームソリューション部のえがわです。

はじめに

re:Inventに参加中ですが、英語に絶賛苦戦中です。

セッション中はスライドがあり、ニュアンスはわかるのですが、
質疑応答や議論となると、まったくついていけません。

その際はWindows11に標準で搭載されているサウンドレコーダーで録音をするのですが、
デフォルトの設定ではAACとなっており、録音を行うとM4Aファイルが作成されます。

私はそのまま録音してしまったので、Amazon Transcribeを使用するため、対応済みの形式に変換する必要がありました。

Amazon Transcribe対応形式
MP3、MP4、WAV、FLAC、AMR、OGG、WebM

変換するには？

MP3やWAVならサクッと変換できるかなと思ったのですが、
・ フリーソフト：会社PCにインストールはしたくない
・ 外部サイト：外部サイトにアップロードはしたくない
・ Pythonで変換：モジュールのインストール、FFmpegの設定がめんどう
と英語の許容量を超えて、考えることを放棄した私にはとても大きな障害がありました。

変換から変更へ

ここでもしかして拡張子だけ変更すれば読み込めるんじゃない？と思い変更してみたところ、
無事に読み込むことができ、文字に起こすこともできました。

需要はないと思いますが、拡張子を変換ではなく変更する怠惰なスクリプトも置いておきます。

import os
import shutil

input_dir = './'
output_dir = './converted_files/'

if not os.path.exists(output_dir):
    os.makedirs(output_dir)

for filename in os.listdir(input_dir):
    if not filename.endswith('.m4a'):
        continue

    base_name = os.path.splitext(filename)[0]
    new_name = base_name + '.mp3'
    new_path = os.path.join(output_dir, new_name)

    # コピー&リネーム
    shutil.copy(os.path.join(input_dir, filename), new_path)

print("Completed!")

最後に

Amazon Transcribeを使用する予定がある方はサウンドレコーダーのデフォルトの保存形式を変更しておきましょう。
また、時間に余裕があるときは変更ではなく変換を行いましょう！
誰かの参考になれば幸いです。

サウンドレコーダーで保存したM4Aファイルを無理やりAmazon Transcribeで文字起こし #AWSreInvent

はじめに

変換するには？

変換から変更へ

最後に

関連記事

主なカテゴリ

AWSで探す

注目のテーマ

プロダクトやサービスで探す

特集やシリーズから探す

お問い合わせ

運営会社